【情报课堂】使用地理空间分析在墨西哥下加利福尼亚州寻找失踪人员
点击下方小卡片关注情报分析师
根据官方数据,墨西哥有100,000多名失踪人员。自2007年以来,由于使用武装部队打击该国与毒品有关的活动,这些案件中的大多数(80%)已被记录在案。联合国强迫失踪问题委员会将失踪描述为一种普遍现象。
因此,有失踪人员的家庭团体和当局正在开展搜查队,在该国不同地区寻找失踪人员。这些人中有一小部分是在秘密或隐藏的坟墓中发现的。据非政府组织和大学称,自2007年以来,墨西哥已经发现了2000多个秘密坟墓。
在这种背景下,五年多来目标是使用机器学习和地理空间技术来开发支持这些搜索的技术。这篇文章将介绍一种划定搜索区域的新方法,这些搜索区域可能在墨西哥西北部的下加利福尼亚州发现新的秘密坟墓。
做了什么
加利福尼亚州位于墨西哥西北部。面积71,450平方公里,人口370万(仅占全国的3.0%),其中94%集中在城市地区。自2007年以来,它一直是受失踪现象影响最大的州之一:根据下加利福尼亚州总检察长(FGEBC)的数据,在此期间有12,000人失踪。同样,对秘密坟墓的调查结果在该地区一再出现。
通过向FGEBC提出信息自由请求,我们能够获得2009年10月至2021年2月期间观察到的144个秘密坟墓的数据。其中,有52个坟墓包括当局所设地点的经纬度。
FGEBC观察到的坟墓可能是当局能够“观察”的特定类型的坟墓。这受到邻近城市地区、特定类型的肇事者或当局可以获得进行搜查队的资源的限制。
此外,虽然坐标已经过核实,但根据地方当局的登记方式,一些仪表可能存在不准确之处。
决定使用这 52 个点作为训练数据来开发一个新的空间分析模型,该模型划分了实体中可能位于该区域的新秘密坟墓的区域。这种新方法包括三种组合方法:点模式分析、可视性与可见性分析相结合以及高光谱分析。
下面解释开发的步骤:
(1) 点模式分析
首先对FGEBC定位的52个墓地进行了空间点模式分析。目的是确定研究区域中点的聚类。如果发现多组坟墓彼此靠近,可以假设坟墓不太可能位于随机位置,而是根据其空间模式在特定区域。此外,可以根据前面点的聚类模式推断尚未发现的坟墓的距离。
康格拉姆、格林和图勒提出了诸如平均最近邻数(ANN)和里普利K函数等特定测试作为检测聚类的适当方法,并在人们失踪的国际或非国际性武装冲突背景下推断这些位置。用QGIS和里普利的K函数及其对L(d)变换函数进行了ANN测试,该函数使用R编程语言在下加利福尼亚州的52个点上进行了。
ANN测试(0.42比率和Z评分为-8.009)表明聚类非常显着,观察到的平均距离为7公里(下加利福尼亚州观察到的坟墓之间的平均距离),预期平均距离为16公里(如果事件是随机的,则为下加利福尼亚州坟墓的平均距离)。这些结果表明,在下加利福尼亚州观察到的秘密墓地不是由肇事者随机选择的,它们聚集在该州的特定地区。
由于检测到聚类,我们随后实现了Ripley的K函数及其L(d)变换,以确定可能的新墓地的距离(以公里为单位),并以先前发现的地点为起点。
换句话说,如果我们站在先前放置坟墓的点上,由于点的集合模式,我们很有可能在18公里-28公里的距离上找到更多的坟墓。
(2) 可访问性和视域分析
秘密坟墓的非法性质迫使肇事者选择隐藏的地点,如峡谷或树木繁茂的地区,以保证他们在埋葬期间的隐私。鉴于这种隐私要求,主要由地形和植被构成的景观结构必须在墓地的选择中发挥关键作用。
另一方面,地理环境对无障碍环境(道路基础设施)施加了限制,特别是因为违背其意愿或人类遗骸的流动需要快速和离散的运输。这些概念使我们从两个关键概念的角度对地理空间进行概念化,即空间可达性和必须与秘密墓地相关的空间隐私。
两个可量化的概念,可访问性和可见性,定义了分析的维度,使我们能够将地理空间划分为四类,如图1所示。大可达性和低隐私性区域被称为公共空间,而低可达性和大隐私的区域定义了私人空间。
在这两个极端情况之间,还有另外两种组合,即共同具有低可达性和低隐私性的风景空间,以及共同具有高可达性和高隐私性的秘密空间。我们假设在后者中更有可能找到秘密坟墓,因此,对此类空间的划分将为搜索任务提供优先顺序方案。
通过考虑秘密空间(CS)的概念,生成了两个下加利福尼亚州的面具。这些维度又分别以旅行时间和能见度百分比来量化。原则上,CS将提出更大的机会容纳秘密坟墓,前提是为了减少被抓住的风险,肇事者选择能够快速进入且不为公众高度可见的地点。
CS 概念是通过使用 MATLAB 进行地理空间建模获得的。地理空间被划分为多个像元,在这些像元上计算城市聚落的行驶时间和能见度指数。
空间可达性计算为从最近的城市像元到地理空间中每个点的累积成本函数,其中成本函数是穿过像元所需的时间。此值是根据道路的最大速度、地形坡度和植被覆盖部分确定的。
空间隐私的计算方式是位于附近道路上的观察点在视线范围内的频率,其中能见度范围限制为几公里。计算是通过累积数字地形模型的视域和位于道路网络上的随机视点来执行的。
了解可见性的另一种方法如下。考虑图2,其中绿色区域突出显示了发现人类遗骸的几个点的视域。然后,可以将这些点的可见性理解为主要道路与绿地的交汇处。在这些情况下,能见度较低,因为大多数视域延伸到主要道路和/或定居点未穿过的区域。
(3) 氮积累或高光谱分析
当身体分解时,它会将养分释放到土壤中,其中氮(N)脱颖而出。 这是因为人体平均含有2.6公斤的氮,分布在3平方米面积上的量相当于温带灌木或树木施肥推荐量的50倍。植物的氮含量与叶片中的叶绿素浓度直接相关。
叶绿素浓度可以使用植被指数进行量化,例如所谓的红边叶绿素指数(RECI)。最近一项针对动物的研究表明,通过检测通过光谱指数检测到的植物叶绿素含量的加速生长可以发现埋葬,其中RECI是最有效的。
建立了一个指数来解释2016-2020年在下加利福尼亚州哨兵-2A / B星座获取的图像中RECI的增加。该指数,这里称为氮积累指数(NAI),是一个介于0-100之间的数字,表示RECI在监测期内的增长速度,其中NAI值为30或更高表示时间序列的整体正趋势。
在实践中,由于其他人为或自然过程可能有助于氮素积累,例如水径流和田间作物施肥,因此NAI层的解释应考虑空间和背景模式。
例如,具有高 NAI 值的大油田不太可能由埋葬引起。卫星图像相对较低的空间分辨率(每像素10米)限制了NAI层的使用,以检测相当大的墓葬。
2020年1月,几份新报纸报道了在下加利福尼亚州发现的为数不多的乱葬坑案例之一。它是在位于蒂华纳市麦克洛维奥罗哈斯地区的一块土地上发现的,里面有十几具尸体。
图 3.NAI 分布在蒂华纳的麦克洛维奥·罗哈斯的万人坑位置周围(左上),NAI 达到值高于 50 的区域(右上)以及该区域的 RECI 时间序列(底部)。
图3显示了NAI指数在该位置周围的分布(左上角),其中红色调突出显示了2016-2020年期间RECI出现积极趋势的区域。NAI 达到高于 50 的值并与秘密空间掩码相交的区域也显示在该图(右上角)以及整个期间的 RECI 值的相应图中。RECI的变化可以通过图像捕获速率下大气和土壤湿度条件的变化来解释。
最重要的是时间序列的整体趋势,这实际上是NAI图像背后的想法。在感兴趣点(POI)以北约25米处观察到最近的NAI异常。虽然我们不能声称这种异常与Maclovio Rojas的乱葬坑有关,但我们不能否认图像像素可能与底图存在空间位置错位,这可以解释这种相对位移。
结果
这三种方法的结果被集成到Google地球引擎应用程序中,该应用程序允许人们可视化和探索它们。
同样发现下加利福尼亚州32%的领土符合这些特征(高可达性和低能见度)。因此,这些已经是开始重新寻找失踪人员的潜在领域。
为了开发这些结果,我们打算进一步减少这一潜在领域。考虑到L(d)测试结果,我们生成了半径在18到28公里之间的圆形缓冲区,围绕着FGEBC先前观察到的坟墓点。
通过创建这些区域与符合秘密空间标准的缓冲区的交叉点,确定潜在的搜索区域可以再减少10%。因此,最终搜索区域必须与大多数城市住区保持合理的距离,在下加利福尼亚州的情况下为39分钟。然而,无法确定搜索旅的确切地点或方向。
此外,通过卫星图像观测到的氮积累可能表明地面上存在异常情况,据推测,尸体可能被掩埋,这与秘密空间掩模的结果和确定区域时的点模式分析结果相辅相成。
四. 今后的步骤
对于此项目,有以下后续步骤:
尝试进一步减少潜在的搜索区域,并用其他机器学习方法进行补充。具体来说正在实现一种监督式机器学习算法。以前使用过这种算法,称为随机森林。
从来自其他信息源的秘密坟墓的地理配准点获取更多信息,以减少使用单一来源可能产生的偏差。
生成背景研究,能够确定所关注领域内人员失踪的动态和模式。这将使能够更好地补充所获得的结果。
与亲属团体举行会议和讲习班,寻找失踪人员,并与国家失踪人员搜索委员会等当局举行会议和讲习班。
识别下方二维码加入情报学院知识星球社群,内有3000+情报专业资料可供下载,成就您的专属情报资料库。
往期推荐